SoSe2021
Die intraspezifische Streuung des Zugverhaltens ist bei Buchfinken kleiner als bei der Mönchsgrasmücke.
Die Varianz \(\sigma^2\) bzw. \(s^2\)
Die Alternativhypothese muss immer eine Effektgröße enthalten (‘Es gibt keinen Unterschied’ kann daher keine \(H_A\) sein).
Die intraspezifische Streuung des Zugverhaltens ist bei Buchfinken kleiner als bei der Mönchsgrasmücke.
| Kenngröße | Buchfink | Mönchsgrasmücke |
|---|---|---|
| Mittelwert | 1800km | 3000km |
| Standardabweichung s | ±900km | ±1000km |
| Stichprobengröße n | 20 | 30 |
Folgende grundlegende Fragen müssen beantwortet werden:
| Entscheidung | \(H_0\) trifft zu | \(H_0\) trifft nicht zu |
|---|---|---|
| \(H_0\) wird nicht abgelehnt | Richtige Entscheidung; kein Effekt nachgewiesen | \(\beta\)-Fehler; vorhandenen Effekt nicht nachgewiesen |
| \(H_0\) wird abgelehnt | \(\alpha\)-Fehler; Effekt nachgewiesen, den es nicht gibt | Richtige Entscheidung; vorhandenen Effekt nachgewiesen |
Hier würden viele lieber einen Fehler 2. Art als einen Fehler 1. Art begehen:
Hier wäre es als Vorsichtsmaßnahme besser, einen Fehler 1. Art zu machen:
Was denken einige Statistiker über Signifikanz?
It is very bad practice to summarize an important investigation solely by a value of P.
Blind adherence to the 0.05 level denies any consideration of alternative strategies, and it is a serious impediment to the interpretation of data ( e.g. 0.049 is significant, but 0.051 is not significant).
Scientist care about whether a result is statistically significant, but they should care much more about whether it is meaningful.
Der statistische Test liefert Dir eine Teststatistik (T) und eine Wahrscheinlichkeit (p-Wert) basierend auf dessen Prüfverteilung, dass das statistische Ergebnis so extrem ausfällt wie das beobachtete, wenn die Nullhypothese wahr wäre (nach der z.B. zwei Stichproben zur gleichen Grundgesamtheit gehören).
Bei den klassischen Tests sollte immer die Teststatistik, der bzw. die Freiheitsgrade (für die Prüfverteilung), und der p-Wert angegeben werden:
shapiro.test():
ks.test():
| Kennwert: | \(\mu\), \(\sigma^2\) bzw. \(\bar{X}\) und \(s^2\) |
| H0: | \(X\) ist normalverteilt |
| HA: | \(X\) ist nicht normalverteilt |
| Teststatistik: | W |
| alpha: | 5% |
| p-Wert: | Teststatistik W wird mit einem kritischen Wert für den Ablehnungsbereich (aus der Verteilung der Teststatistik) verglichen. |
shapiro.test(x = bf) # Buchfink
Shapiro-Wilk normality test
data: bf
W = 0.96858, p-value = 0.7247
shapiro.test(x = mgm) # Moenchsgrasm.
Shapiro-Wilk normality test
data: mgm
W = 0.97102, p-value = 0.5674| Kennwert: | \(\mu\), \(\sigma^2\) bzw. \(\bar{X}\) und \(s^2\) |
| H0: | \(F_X = F_0\) (Verteilungsfunktion von \(X\) ist \(F_0\)) |
| HA: | \(F_X \neq F_0\) |
| Teststatistik: | D |
| alpha: | 5% |
| p-Wert: | Teststatistik D wird mit einem kritischen Wert für den Ablehnungsbereich (aus der Verteilung der Teststatistik) verglichen. |
# Hier muss die zu prüfende Verteilung # und dessen Parameter übergeben werden: ks.test(bf, "pnorm", mean = mean(bf), sd = sd(bf))
One-sample Kolmogorov-Smirnov test
data: bf
D = 0.10709, p-value = 0.9572
alternative hypothesis: two-sided
ks.test(mgm, "pnorm", mean = mean(mgm), sd = sd(mgm))
One-sample Kolmogorov-Smirnov test
data: mgm
D = 0.11097, p-value = 0.8147
alternative hypothesis: two-sidedvar.test():
bartlett.test():
car::leveneTest():
Die intraspezifische Streuung des Zugverhaltens ist bei Buchfinken kleiner als bei der Mönchsgrasmücke.
| Kenngröße | Buchfink | Mönchsgrasmücke |
|---|---|---|
| Mittelwert | 1800km | 3000km |
| Standardabweichung s | ±900km | ±1000km |
| Stichprobengröße n | 20 | 30 |
| Kennwert: | \(\sigma^2\) bzw. \(s^2\) |
| H0: | \(\sigma^2_{BF} = \sigma^2_{MGM}\) bzw. \(F=1\) |
| HA: | \(\sigma^2_{BF} \neq \sigma^2_{MGM}\) bzw. \(F \neq 1\) |
| Vorraussetzung: | Erfüllt (Daten sind normal verteilt) |
| Teststatistik: | \(F = \frac{\text{größeres}~s_1^2}{\text{kleineres}~s_2^2}\)* |
| alpha: | 5% |
| FG: | FG1 = n1-1; FG2 = n2-1 |
| p-Wert: | Der F-Wert wird mit dem \(F_{krit}\) aus der F-Verteilung verglichen. |
*Die größere Varianz kommt in den Zähler. Damit ist F immer ≥ 1.
s1_mgm <- 1000^2 # groessere Stichprobenv. s2_bf <- 900^2 # kleinere Stichprobenv. (f_val <- s1_mgm/s2_bf)
[1] 1.234568
# krit. F (bei n1=30, n2=20): qf(p = 0.95, df1 = 29, df2 = 19)
[1] 2.077214
# p verdoppeln fuer 2seitige Hypotese: 2*pf(q = f_val, df1 = 29, df = 19, lower.tail = FALSE)
[1] 0.6409985
var.test()var.test( x = mgm, # Stichprobe mit groesserer Varianz y = bf # Stichprobe mit kleinerer Varianz )
F test to compare two variances
data: mgm and bf
F = 1.2346, num df = 29, denom df = 19, p-value = 0.641
alternative hypothesis: true ratio of variances is not equal to 1
95 percent confidence interval:
0.5139872 2.7546591
sample estimates:
ratio of variances
1.234568 Unterscheidet sich die Varianz dieser 3 Vogelarten?
| Kenngröße | Buchfink | Grünfink | Mönchsgrasmücke |
|---|---|---|---|
| Mittelwert | 1800km | 1950km | 3000km |
| Standardabweichung s | ±900km | ±400km | ±1000km |
| Stichprobengröße n | 20 | 10 | 30 |
Für beide Tests müssen die Daten in einem data frame im langen Format sein. Die kategoriale Variable (die Art) sollte als Faktor definiert sein (nicht als Zeichenkette):
str(zug)
'data.frame': 60 obs. of 2 variables: $ art : Factor w/ 3 levels "Buchfink","Grünfink",..: 1 1 1 1 1 1 1 1 1 1 ... $ laenge: num 1150 1456 3111 1734 1789 ...
bartlett.test(x = zug$laenge, g = zug$art)
Bartlett test of homogeneity of variances
data: zug$laenge and zug$art
Bartlett's K-squared = 7.8288, df = 2, p-value = 0.01995
car::leveneTest(y = zug$laenge, group = zug$art)
Levene's Test for Homogeneity of Variance (center = median)
Df F value Pr(>F)
group 2 3.5347 0.03572 *
57
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1Bei beiden Tests kann die \(H_0\) abgelehnt werden. Die Varianzen unterscheiden sich signifikant voneinander (Bartlett’s \(K^2\) = 7.8 und p = 0.02 bzw. Levene’s F = 3.5 und p = 0.04).
irisshapiro.test(iris$Sepal.Length[iris$Species=="setosa"])
Shapiro-Wilk normality test
data: iris$Sepal.Length[iris$Species == "setosa"]
W = 0.9777, p-value = 0.4595
shapiro.test(iris$Sepal.Length[iris$Species=="versicolor"])
Shapiro-Wilk normality test
data: iris$Sepal.Length[iris$Species == "versicolor"]
W = 0.97784, p-value = 0.4647
shapiro.test(iris$Sepal.Length[iris$Species=="virginica"])
Shapiro-Wilk normality test
data: iris$Sepal.Length[iris$Species == "virginica"]
W = 0.97118, p-value = 0.2583irisbartlett.test(x = iris$Sepal.Length, g = iris$Species)
Bartlett test of homogeneity of variances
data: iris$Sepal.Length and iris$Species
Bartlett's K-squared = 16.006, df = 2, p-value = 0.0003345Bei weiteren Fragen: saskia.otto(at)uni-hamburg.de

This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License except for the borrowed and mentioned with proper source: statements.
Image on title and end slide: Section of an infrared satellite image showing the Larsen C ice shelf on the Antarctic Peninsula - USGS/NASA Landsat: A Crack of Light in the Polar Dark, Landsat 8 - TIRS, June 17, 2017 (under CC0 license)